VLDB2025 | Magnus: 字节跳动面向大规模机器学习的数据管理方案 机器学习广泛应用于字节跳动,数据作为机器学习训练的核心要素,如何高效灵活的管理支撑大规模训练数据的存储、生产以及训练,成为数据基础设施的一大挑战;近两年大模型迅猛发展,对数据集管理也提出了更多新的场景需求。 字节 机器学习 iceberg magnus vldb202 2025-09-04 19:46 3